
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍在 AI 领域,英伟达开发的 CUDA 是驱动大语言模型(LLM)训练和推理的核心计算引擎。
在 AI 领域,英伟达开发的 CUDA 是驱动大语言模型(LLM)训练和推理的核心计算引擎。
“对发现问题的投入,与解决问题同样重要。”这是上海人工智能实验室主任周伯文在首届明珠湖会议所作开场报告中的核心观点之一。
第一个 AI 搜索引擎,要归苹果了?
最近,一类「穿越 vlog」爆火了。有人让 Veo 3 变成「时间机器」,将人们带回历史事件中进行现场直播。
随着语言模型在强化学习和 agentic 领域的进步,agent 正在从通用领域快速渗透到垂直领域,科学和生物医药这类高价值领域尤其受到关注。
在 AI Agent 浪潮席卷行业的当下,高效优雅开发具备复杂推理与协作能力的智能体成为业界焦点。本文将系统梳理 AI Agent 核心理念、主流协议与思考框架,并结合 Golang 生态工程化框架,深入剖析多 Agent 协作系统的设计与落地。
MarTech 一直是 SaaS 的重「金」区和激战区。因为离钱近,很多有野心的 founder 在思考如何借助 AI 创业时,都会首选 AI + MarTech 领域。
你有没有想过,为什么互联网时代的工作还是这么繁琐?为什么我们还在重复填写表格、点击按钮、手动查找信息?当 AI 能够写代码、画图、甚至思考复杂问题时,为什么我们仍然被困在一个个网页界面中,像机器人一样执行着重复性任务?
李亚飞做了 20 多年全栈工程师,技术社区和面向程序员的产品做了十多年,经手过数不清的软件项目。
自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。